home *** CD-ROM | disk | FTP | other *** search
/ Best of www.BestZips.com (Collector's Edition) / Best of WWW.BESTZIPS.COM Collector's Edition (JCSM Shareware) (JCS Marketing).ISO / gamebord / scrabl41.zip / MUSINGS.TXT < prev    next >
Text File  |  1996-09-15  |  5KB  |  114 lines

  1.                                 MUSINGS
  2.    Concerning relative vowel and consonant frequencies in the OSPD3, and 
  3.        conclusions that may be drawn about rack balance therefrom.
  4. ▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄
  5.  
  6.  
  7. This is not a formal research piece. It is easy enough to compile statistics 
  8. on letter frequencies in the OSPD3 using the computer, but drawing useful 
  9. conclusions from these statistics is another matter altogether. With that 
  10. disclaimer out of the way, let us begin.
  11.  
  12. Let us call the proportion of vowels to total letters in a given word list, 
  13. expressed as a percent, V%. For all the words in the OSPD3, V% = 38.56, that 
  14. is, vowels make up 38.56% of all the letters in all the words in the OSPD3. 
  15. Similarly, V% for the 1254 words newly added to the OSPD3 is 45.32. The words 
  16. added to the OSPD3 have a rather higher proportion of vowels to consonants 
  17. than does the typical run of words already present there.
  18.  
  19. Taking V% for a supplementary list of 133,282 words longer than eight 
  20. letters, we get 41.73. A tentative conclusion is that lists of very short 
  21. words and very long words have a higher V% than lists of intermediate length 
  22. words. This can be tested.
  23.  
  24. Calculating V% for the OSPD3 according to words of given length, we get the 
  25. following figures:
  26.  
  27. 2-letter words:  53.57
  28. 3-letter words:  41.99
  29. 4-letter words:  38.92
  30. 5-letter words:  38.66
  31. 6-letter words:  39.14
  32. 7-letter words:  38.75
  33. 8-letter words:  38.91
  34. 9-letter words:  37.30
  35. 10-letter words: 38.82
  36. 11-and above letter words: too few words in OSPD3 to analyze meaningfully.
  37.  
  38. It appears that V% does indeed settle down to a figure in the range of 38 - 
  39. 39 for 4 to 10 letter words. What does this mean in terms of rack balance and 
  40. playing strategy in a real world Scrabble (tm) game?
  41.  
  42. It would appear that a balanced rack (7-letters) should have about 3 vowels 
  43. and 4 consonants (43%, the closest approach to a V% of 38-39). Of course this 
  44. is scant consolation if you have a "balanced" rack of VWXZUUU. The trick is 
  45. having the *right* consonants and vowels, and less critically the relative 
  46. proportion.
  47.  
  48. =============================================================================
  49.  
  50. Words in the English language, and OSPD, are "random"* in the sense defined 
  51. by the mathematician John Casti. This means that words cannot be reliably 
  52. constructed by a formula or algorithm. For example, given the set of 
  53. consonants, C{ b, c, d, f, g, h ... } and the set of vowels, V{ a, e, i, o, 
  54. u, y }, try to find a method of creating English words, say by taking 3 from 
  55. set C and 2 from set V. This approximates the V% found above. Most of the 
  56. "words" formed by trial and error by this 3-to-2 rule will form strings of 
  57. letters not found in any English language dictionary, nor in the OSPD3, 
  58. non-words in other words.
  59.  
  60. Casti defines a "random" number as a real number whose shortest representa-
  61. tion is itself. By the same token, I would say a "random"* word is likewise 
  62. one whose simplest representation is itself. Therefore, =all= the words in 
  63. the English language, and the OSPD, are "random". There is no mathematical 
  64. formula for constructing words in any spoken / written language. This gives 
  65. natural human languages their richness, complexity, diversity, and unpre- 
  66. dictability.   Ain't language wonderful, hon! 
  67.  
  68. footnote:
  69. --------
  70. *You could also make a case that words are "chaotic" rather than "random", 
  71. that is, falling into a pattern, but not one that is predictable or 
  72. computable.
  73.  
  74. ============================================================================
  75. Addendum: A couple of interesting "imbalanced" vowel / consonant word lists.
  76.          By increasing length, champion "imbalanced" words:
  77.  
  78. HIGH-CONSONANT LIST             
  79. crwth
  80. crwths
  81. tsktsks
  82. borschts
  83. strengths
  84. throttling
  85. abstractest
  86. backdropping
  87. scratchbrush (not in OSPD3)
  88.  
  89. HIGH-VOWEL LIST
  90. aalii
  91. euouae (not in OSPD3)
  92. yautia
  93. ouguiya
  94. aboideau
  95. zoogloeae
  96. homoiousia (not in OSPD3)
  97. squeegeeing
  98. housesitting
  99.  
  100. ▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄
  101.  
  102. Scrabble and OSPD are trademarks of the Milton Bradley Co., Inc.
  103.  
  104.  
  105. The above musings are the product of the demented mind of the author of the 
  106. SCRABLST,WAK, and WORDY packages.
  107.  
  108.                                M\Cooper
  109.                               PO Box 237
  110.                        St. David, AZ 85630-0237
  111.            ------------------------------------------------
  112.                     E-mail: thegrendel@theriver.com
  113.            Web: http://personal.riverusers.com/~thegrendel/
  114.